L'interaction au service de l'optimisation à grande échelle des entrepôts de données relationnels

نویسنده

  • Amira Kerkad
چکیده

The database technology is an adequate environment for the interaction. It may concern severalcomponents of the DBMS: (a) the data, (b) the queries, (c) the optimization techniques and (d) the devices. Atthe data level, correlations between attributes are extremely common in the real world relational data, and havebeen exploited to define materialized views and indexes. At the query level, interaction has been massivelystudied under the problem of multi-query optimization. The data warehouses with their star join queriesincrease the rate of the interaction. The query interaction has been used for selecting optimization techniquessuch as indexes. The interaction also contributes in selecting multiple optimization techniques such asmaterialized views, indexes, data partitioning and the clustering. In existing studies, the interaction concernsonly one component. In this thesis, we consider the multi-component interaction, with three optimizationtechniques, where each one concerns one component: the query scheduling (query level), the horizontal datapartitioning (data level) and the buffer management (device level). The query scheduling (QS) consists indefining an optimal order of executing queries to allow some queries to get benefit from already processed data.The horizontal data partitioning (HDP) divides the instances of each relation into disjoint subsets. The buffermanagement (BM) consists in allocating and replacing data in the buffer pool to lower the cost of queries.Usually, these problems are treated either in isolation or pairwise such as BM and QS. However, these problemsare similar and complementary. A deep formalization for off-line and online scenario of these problems is givenand advanced algorithms inspired from natural bees behavior are proposed. Our proposal has been validatedusing a simulator and real DBMS (Oracle) using a large scale of star schema benchmark.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Analyse de la Vraisemblance des Liens Relationnels : Une méthodologie d'analyse classificatoire des données

Résumé. La méthodologie de classification des données par l’Analyse de la Vraisemblance des Liens Relationnels a pris naissance vers la fin des années soixante. Elle s’est très largement développée. De nombreux chercheurs et praticiens ont pris part à son développement. De nombreuses applications d’envergure provenant des domaines les plus divers (Bioinformatique, Informatique, Sciences sociale...

متن کامل

Echantillonnage optimisé de données temporelles distribuées pour l'alimentation des entrepôts de données

Résumé. Les entrepôts de données sont de plus en plus alimentés par des données provenant d’un grand nombre de capteurs. Les capteurs trouvent leur utilité dans plusieurs domaines : médical, militaire, trafic routier, météorologie ou encore des données de consommation électrique. Pour faire face à la volumétrie et au taux d’arrivée des flux de données, des traitements sont effectués à la volée ...

متن کامل

Maintenance de charges pour l'optimisation des entrepôts de données évolutifs : aide à l'administrateur

Résumé. Dans un contexte où les entrepôt de données sont amenés à subir des évolutions, nous proposons d’aider l’administrateur à la maintenance de la charge (ensemble de requêtes) qui sert à l’évaluation des performances. En répercutant les évolutions de l’entrepôt de données sur la charge, il est alors possible pour l’administrateur d’avoir une gestion pro-active des performances, évitant d’a...

متن کامل

Entrepôts de données sur grilles de calcul

Résumé Les entrepôts de données sont utilisés pour l'exploitation et l'analyse de grands volumes de données extraits des systèmes d'informations en exploitation. Un modèle multidimensionnel organise l'entrepôt de données selon plusieurs axes d'analyse appelés « dimensions ». Les systémes OLAP (OnLine Analytical Processing) permettent une exploration interactive des données contenues dans un ent...

متن کامل

Évaluation de l'influence dans un réseau multi-relationnel : le cas de Twitter

RÉSUMÉ. L’influence sur Twitter est devenue un sujet de recherche important. Certains utilisateurs révèlent plus de capacité que d’autres pour influencer les personnes avec lesquelles ils sont connectés. Ainsi, trouver les utilisateurs les plus influents peut permettre une diffusion efficace de l’information à grande échelle, action très utile dans le marketing ou les campagnes politiques. Dans...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013